Ước lượng của trung bình và phương sai Ước lượng

Ta chọn ngẫu nhiên n cá thể trong một dân số gồm N cá thể. Ta quan tâm đến đặc trưng định lượng Y của dân số với trung bình Y ¯ {\displaystyle {\overline {Y}}} và phương sai V(Y). Trong mẫu đó, đặc trưng Y có trung bình và phương sai đo được lần lượt là y ¯ {\displaystyle {\overline {y}}} và σ 2 = 1 n ∑ i = 1 n ( y i − y ¯ ) 2 {\displaystyle \sigma ^{2}={\frac {1}{n}}\sum _{i=1}^{n}(y_{i}-{\overline {y}})^{2}} . Lưu ý là các giá trị y ¯ {\displaystyle {\overline {y}}} và σ 2 {\displaystyle \sigma ^{2}} thay đổi tùy theo mẫu thử, do đó chúng là các biến ngẫu nhiên với trung bình và phương sai riêng khác nhau.

Ước lượng trung bình của Y

Thông thường trung bình của Y, tức là Y ¯ {\displaystyle {\overline {Y}}} được ước lượng bởi: y ¯ = 1 n ∑ i = 1 n y i {\displaystyle {\overline {y}}={\frac {1}{n}}\sum _{i=1}^{n}y_{i}} .còn được gọi là trung bình tích lũy (hay trung bình cộng). Ta chứng minh được đây là ước lượng đúng(unbiased), nghĩa là E ( y ¯ ) = Y {\displaystyle E({\overline {y}})=Y}

Ước lượng phương sai của Y

σ 2 {\displaystyle \sigma ^{2}} là một ước lượng của V(Y), nhưng là ước lượng không đúng, ta chứng minh được kì vọng của σ 2 {\displaystyle \sigma ^{2}} luôn nhỏ hơn V(Y), tức ước lượng là thiếu.

Các ước lượng đúng của V(Y) là:

  • n n − 1 σ 2 {\displaystyle {\frac {n}{n-1}}\sigma ^{2}} trong trường hợp lấy mẫu có hoàn lại
  • N N − 1 n n − 1 σ 2 {\displaystyle {\frac {N}{N-1}}{\frac {n}{n-1}}\sigma ^{2}} trong trường hợp lấy mẫu không hoàn lại.

Trong trường hợp mẫu lớn, phép tính có hoàn lại và phép tính không hoàn lại là như nhau, vì N N − 1 {\displaystyle {\frac {N}{N-1}}} xấp xỉ bằng 1. Vì vậy trong trường hợp tổng quát ước lượng đúng của V(Y) là: s 2 = 1 n − 1 ∑ i = 1 n ( y i − y ¯ ) 2 {\displaystyle s^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(y_{i}-{\overline {y}})^{2}} được gọi là phương sai tích lũy của Y.

Xem thêm chứng minh trong bài Phương sai

Tính hiệu quả và tính hội tụ

Mức độ dao động của y ¯ {\displaystyle {\overline {y}}} quanh kì vọng của nó phụ thuộc vào phương sai của nó, ký hiệu bởi V ( y ¯ ) {\displaystyle V({\overline {y}})} . Phương sai này được tính theo V(Y).

  • V ( y ¯ ) = V ( Y ) n {\displaystyle V({\overline {y}})={\frac {V(Y)}{n}}} trong trường hợp lấy mẫu có hoàn lại
  • V ( y ¯ ) = N − n N − 1 V ( Y ) n {\displaystyle V({\overline {y}})={\frac {N-n}{N-1}}{\frac {V(Y)}{n}}} trong trường hợp lấy mẫu không hoàn lại.

Ta nhận thấy với N rất lớn hai giá trị trên gần như bằng nhau. Phần sau đây ta chỉ xét trường hợp lấy mẫu có hoàn lại, với giả thuyết N là rất lớn.

Rõ ràng n càng lớn, V ( y ¯ ) {\displaystyle V({\overline {y}})} càng nhỏ. Do đó, mẫu càng lớn, ước lượng y ¯ {\displaystyle {\overline {y}}} càng hiệu quả.

Bất đẳng thức Bienaymé-Tchebychev chỉ ra rằng, với mọi số thực dương ϵ {\displaystyle \epsilon } ,

p ( | y ¯ − Y ¯ | > ϵ ) < V ( y ¯ ) ϵ 2 {\displaystyle p(|{\overline {y}}-{\overline {Y}}|>\epsilon )<{\frac {V({\overline {y}})}{\epsilon ^{2}}}}

nên

p ( | y ¯ − Y ¯ | > ϵ ) < V ( Y ) n ϵ 2 {\displaystyle p(|{\overline {y}}-{\overline {Y}}|>\epsilon )<{\frac {V(Y)}{n\epsilon ^{2}}}}

Vì V ( Y ) n ϵ 2 {\displaystyle {\frac {V(Y)}{n\epsilon ^{2}}}} hội tụ về 0 khi n tiến về vô cực, nên ta cũng có điều tương tự với p ( | y ¯ − Y ¯ | > ϵ ) {\displaystyle p(|{\overline {y}}-{\overline {Y}}|>\epsilon )} . Ước lượng y ¯ {\displaystyle {\overline {y}}} là hội tụ.